草庐IT

Python BeautifulSoup 提取特定的 URL

全部标签

python - lxml:来自 URL 的一些 XML 给出了这个 lxml.etree.XMLSyntaxError

我有一个脚本,可以从URL列表的XML文件中提取一些术语。所有URL都可以访问XML数据。它在第一次正确打开、解析和提取时工作正常,但随后在过程中被某些XML文件中断并出现此错误:File"",line18,inFile"lxml.etree.pyx",line2953,inlxml.etree.parse(src/lxml/lxml.etree.c:56204)File"parser.pxi",line1555,inlxml.etree._parseDocument(src/lxml/lxml.etree.c:82511)File"parser.pxi",line1585,inlxm

xml - 使用 ImportXML 提取包含字符串的链接的 URL 和 anchor

我正在尝试在Google表格中使用ImportXML来提取包含该字符串的链接的URL和anchor。问题是我想避免对字符串进行硬编码,并希望将其从另一个单元格中拉出。硬编码示例:=IMPORTXML("http://www.debian.org/mirror/list","//a/@href[contains(.,'about')]")期望的结果(使用A2代替about):=IMPORTXML("http://www.debian.org/mirror/list","//a/@href[contains(.,A2)]")我尝试将A2放在引号中,但没有用。 最

xml - XPath:选择具有命名空间的特定节点

我需要在xml文档中选择一个节点,但是它上一层的节点有一个命名空间。如何做到这一点?我的xml文件的一部分:SharedDBStandardDataA1DBDB这是我需要获取的“部分”节点。由于命名空间,语句:node2=node.SelectSingleNode("//Section")不起作用。我需要用什么来代替“//Section”部分才能使其正常工作?编辑:我将vb.Net与System.Xml包一起使用 最佳答案 这取决于您用来处理xpath的软件。您可以使用纯xpath做的最好的事情是//*[local-name()='

html - 相同域、协议(protocol)和端口上的 Chrome "Unsafe attempt to load URL"

在Chrome中,当我尝试访问下面错误中显示的xml链接时,我收到了这个错误。UnsafeattempttoloadURLhttp://build:8080/view/application/job/Project/Report/SourceMonitor.xsltfromframewithURLhttp://build:8080/view/application/job/Project/Report/SourceMonitor-details.xml.Domains,protocolsandportsmustmatch.据我所见,域、协议(protocol)和端口是相同的。这些文件都

c# - 仅反序列化 XML 中的特定项目并添加到列表

我有一个包含多个项目的XML文件,我想一次只反序列化一个特定的项目,而不是所有项目,然后将其添加到列表中。使用thissite中的示例,如何仅反序列化Id=2的Product并将其添加到productList?类:publicclassProduct{publicintId{get;set;}publicstringName{get;set;}}代码:voidfoo(){stringxmlString="1MyXMLproduct2Mysecondproduct";XmlSerializerserializer=newXmlSerializer(typeof(List),newXmlR

json - 如何从 XSLT 中的 JSON 中提取数据?

我在XSLT中调用休息服务并作为返回获得JSON响应。如何使用XSLT从JSON响应中提取数据。下面是用于调用其余服务并给出JSON响应的XSLT代码。我需要从JSON响应中提取Cookie1、Cookie2和Cookie3的值。XSLTJSON响应:{"mapData":{"Cookie1":"KlzpP965iBw==","status":"True","Cookie2":"DDGT8mcsuzdMNNQ=","Cookie3":"VERSION_4~mPpYUDcZnoJ0Z"}}请告诉我如何使用XSLT执行此操作。 最佳答案

xml - XSLT 子字符串 - 在特定字符串之前获取所有值

我有元素:11511/direction=sink110/direction=src当然也有一些元素没有/direction需要提及的后缀。如果元素A和B包含字符串/direction...我想在字符串/direction之前得到值.如果元素不包含/direction然后像往常一样取常规值。我应该在value-of中添加什么?子句?我试过但是然后没有值的值/direction设置为不正确的值null我也试过这个但后来出现错误:我想要值11511和110结果。谢谢 最佳答案 一种可能性是使用条件处理,和choose取决于内容的备选操作

c# - XML 获取特定元素

我有一个如下所示的XML文档:xxxxxxxxxx.x@x.comx我正在尝试获取这样的电子邮件地址:varemails=xmlContent.Root.Elements("Resources").Elements("item").Elements("Emails");foreach(XElementeleminemails){Console.Write(elem.Value);}这是行不通的。关于如何在C#中从这种类型的XMLXDocument获取电子邮件地址有什么想法吗?我浏览了一些论坛和教程,但似乎无法掌握XPath等。 最佳答案

xml - 如何使用 XPath 1.0 提取某个节点之前的任何文本?

我需要单个XPath表达式来选择节点前面的任何文本,而不管结构和层次结构如何。例如,如何提取节点之前的文本在以下情况下:案例1:12预期结果:2案例2:12预期结果:2案例三:Textchildtext预期结果:“子文本”或“文本子文本”案例4:Textchildtexttail预期结果:“tail”、“texttail”或“textchildtexttail”等等,尽可能多的情况。实际上,我想要的只是前面文本的最后一个字符,因此结果是否包含来自任何嵌套中间子元素的文本并不重要。 最佳答案 //target/preceding::t

xml - Powershell - 创建具有特定命名空间的 XML

我需要创建这个XML:..但是虽然我知道如何使用XMLWriter编写命名空间(例如:$XmlWriter.WriteAttributeString("xmlns","xsi","http://www.w3.org/2000/xmlns/","http://www.w3.org/2001/XMLSchema-instance");..我一直无法在变量中这样做:[xml]$XML=New-ObjectSystem.Xml.XmlDocument$Declaration=$XML.CreateXmlDeclaration("1.0","UTF-8",$Null)$XML.AppendChi